Korpuslinguistik - zu wissenschaftstheoretischer Grundlagen und methodologischen Perspektiven
نویسنده
چکیده
Im Zusammenhang mit den folgenden Überlegungen steht der Terminus Korpuslinguistik für die Gesamtheit aller Tätigkeiten, die darauf gerichtet sind, (1) umfangreiches authentisches Sprachoder Textmaterial (gesprochen oder geschrieben) zu sammeln, zusammen zu stellen, aufzubereiten, mit Informationen zu annotieren, zu verwalten und zu warten sowie verfügbar zu machen, (2) solches Material für wissenschaftliche oder technische Zwecke oder andere Anwendungen systematisch auszuwerten. Das oft konstatierte, wachsende Interesse an Korpus-basierten Ansätzen hat verschiedene Gründe. Zunächst waren Vorbedingungen für die zunehmende Erstellung bzw. Verwendung von großen maschinenoperablen Textkorpora Fortschritte in der Hardund Softwaretechnik sowie leistungsstarke Verfahren der Sprachtechnologie. Die heutige Hardware-, Softwareund Netzwerktechnik erleichtern Digitalisierung, elektronische Produktion, Speicherung und Verbreitung von großen Textmengen und sichern somit die Verfügbarkeit von Sprachkorpora. Sprachtechische Verfahren ermöglichen die Indizierung, (teil-)automatische linguistische Annotation sowie effektive Zugriffsund Abfragesysteme. Mit der Verfügbarkeit großer und größter Materialsammlungen wurde die früher übliche intellektuelle Inspektion von Texten nach und nach durch die Verwendung statistischer Verfahren abgelöst. Der Durchbruch für die quantitativ-empirischen Ansätze in der maschinellen Sprachverarbeitung kam u. a. mit den Erfolgen der Hidden-MarkovModelle in Systemen zur Verarbeitung gesprochener Sprache. Doch auch in anderen Bereichen der Sprachtechnik konnten bereits bald viel versprechende Ergebnisse durch den Einsatz statistischer Verfahren erzielt werden. Heute gibt es kaum ein Anwendungsfeld der Computerlinguistik, in dem statistische Methoden nicht – in Kombination mit der oder als Alternative zur diskret-symbolischen Verarbeitung – eine wichtige Rolle spielen. Wissenschaftstheoretisch betrachtet sind große Mengen von Sprachdaten und ihre statistische Auswertung unverzichtbar für das Überprüfen von Hypothesen, da sprachliche und textuelle Erscheinungen nur in Ausnahmefällen ausreichend mit Hilfe rein formaler Ansätze erfasst werden können. Neben den wissenschaftstheoretischen Einsichten hat dies besonders das praktische Scheitern computerlinguistischer Ansätze, die allein auf formalen Grammatiken u. ä. beruhen, zu genüge gezeigt. Vagheit, Unschärfe, Indeterminiertheit, Variabilität, Dynamik etc. sind Charakteristika der Sprache, die nur durch quantitative Begriffe und Modelle adäquat abgedeckt werden können. Dazu kommt die in vielen Fällen prinzipiell bestehende Unmöglichkeit, den jeweiligen Untersuchungsge-
منابع مشابه
Korpuslinguistik in der linguistischen Lehre: Erfolge und Misserfolge
Für die sprachwissenschaftliche Ausbildung an den Universitäten ist es zwar unabdingbar, die Studierenden in die Theorie und Methoden der Korpuslinguistik einzuführen, doch als Lehrperson kämpft man dabei mit einer Reihe von Problemen, denn das technische und methodische Know-how der Studierenden ist oft sehr heterogen. Zudem zeigt sich die Wichtigkeit, die Studierenden für korpuslinguistisches...
متن کاملRealitätsbezug von Informationsmodellen - Eine Erwiderung auf Kritik
1 Einleitung ROLAND KASCHEK hat in seinem Beitrag „Schwachstellen einer Analyse des Modellbegriffs“ meinen Beitrag „Zum Realitätsbezug von Informationsmodellen“ einer pointierten Kritik unterzogen. Der Stellungnahme zu den einzelnen Kritikpunkten sollen drei Anmerkungen vorangestellt werden. Erstens wird ein kritischer Diskurs zu diesem Thema sehr begrüßt, da das Verständnis von Informationsmod...
متن کاملSoftware-Engineering Culture. Vom Umgehen miteinander und mit externen Partnern in IT-Projekten - Seminare in Aus- und Weiterbildung
Ziel eines Projekts ist die effiziente und effektive Erstellung eines Produkts oder Durchführung einer Dienstleistung. Eine gute Projektkultur kann wesentlich zum Projekterfolg beitragen. Das Wissen um zwischenmenschliche Interaktionen, Grundlagen der Organisationsund Projektkultur, Methoden der Teambildung und der Personalentwicklung und die Einbettung dieser Grundlagen und Methoden in Qualitä...
متن کاملInformatisierung der Arbeit: Praxis - Theorie - Empirie
Computeranwendungen sind als neue Arbeitsmittel dabei, Arbeit grundsätzlich zu verändern. Notwendig sind Bestandsaufnahmen dieser neuen Realität aus lokalen sowie globalen Perspektiven, um neue Handlungsperspektiven zu erarbeiten. Im Workshop soll der Versuch unternommen werden, zum Thema „Informatisierung der Arbeit“ verschiedene Perspektiven aus Praxis, Politik und Forschung zusammenzuführen....
متن کاملWissensmanagement und Wissenssoziologie
(0) In den letzten Jahren ist das Wissensmanagement zu einer breiten Bewegung geworden, die sich insbesondere im Schnittfeld von wissenschaftlicher Grundlagenforschung und praktischer Anwendung ansiedelt. Trotz ihrer Nähe hat sich jedoch die Wissenssoziologie, die naturgemäß Wissensprozesse untersucht, bislang kaum mit dieser noch recht jungen Disziplin auseinandergesetzt. In meinem hier zusamm...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- LDV Forum
دوره 20 شماره
صفحات -
تاریخ انتشار 2005